7.14 实例3 提取各分组下唯一值
对类型列执行分组,并且罗列各类型下的子类
import pandas as pd
df=pd.read_excel(r"D:\Pyobject2023\object\测试\素材\1.7.14 实例3 提取各分组下唯一值.xlsx")
print (df)
# t=df.groupby("细分市场").apply(lambda d:d.产品名称.unique()).to_frame().reset_index().rename(columns={0:"产品名称"})
# {0:"产品名称"}中的0不是字符类型
t=df.groupby("细分市场").agg({"产品名称":lambda s:s.unique()}).reset_index()
print (t)
返回:
物料编号 | 数量 | 财务日期 | 收入 | 产品名称 | 细分市场 | |
---|---|---|---|---|---|---|
0 | 1292-401-41-3 | 4980.0 | 2023-12-19 | 0.00 | 排母 | 工业控制 |
1 | 1272-061-12-1 | 8960.0 | 2023-12-29 | 0.00 | 排母 | 医疗&其他 |
2 | 1272-061-12-1 | 8960.0 | 2023-12-29 | 0.00 | 排母 | 医疗&其他 |
3 | 1207-032-17-3 | 3200.0 | 2023-12-25 | 0.00 | 排针 | 数据通信 |
... | ... | ... | ... | ... | ... | ... |
10606 | 80-0012-6784-0 | 1000.0 | 2024-02-21 | 12373.18 | S87 | 工业控制 |
10607 | 80-0013-8735-8 | 72000.0 | 2024-02-27 | 18927.43 | Midgie(排母) | 工业控制 |
[10608 rows x 6 columns]
细分市场 | 产品名称 | ||||||||
---|---|---|---|---|---|---|---|---|---|
0 | 医疗&其他 | [排母, | SCI, | 排针, | 牛角连接器, | 汽车连接器, | WAFER, | 网口连接器... | |
1 | 工业控制 | [排母, | S87, | D-SUB, | WAFER, | 排针, | 牛角连接器, | 网口连接器, | 电源插座... |
2 | 数据通信 | [排针, | 牛角连接器, | WAFER, | Tx-PCIe, | Tx-26P | miniSAS, | 电源... | |
3 | 新能源 | [排针, | 排母, | nan, | 牛角连接器, | WAFER, | IC插座, | D-SUB, | 汽车连接器] |